AI资讯新闻榜单内容搜索-Coding Age

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Coding Age
花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

如今的 AI Agent 正在大规模落地,其中应用最广且最受关注的当数 Claude Code,Codex,Cursor 这类 coding agent。过去的一年里,这类 coding agent 产品迭代迅速,在一年内将在 swe-bench- verified 的准确率提高到了 78%+。

来自主题: AI技术研报
6473 点击    2026-05-19 10:00
24小时从零写一个GBA模拟器!GPT-5.5跑出53分登顶,Gemini得了0.8分,底部还有两家交白卷

24小时从零写一个GBA模拟器!GPT-5.5跑出53分登顶,Gemini得了0.8分,底部还有两家交白卷

24小时从零写一个GBA模拟器!GPT-5.5跑出53分登顶,Gemini得了0.8分,底部还有两家交白卷

Mechanize 发布了一项硬核测试:给前沿 AI coding agents 24 小时,用 Rust 从零写一个完整的 Game Boy Advance 模拟器,再和顶级开源模拟器 Mesen2 逐帧对比打分。

来自主题: AI技术研报
7642 点击    2026-05-18 16:48
马斯克人在北京,xAI发布首款Coding Agent

马斯克人在北京,xAI发布首款Coding Agent

马斯克人在北京,xAI发布首款Coding Agent

没错,大洗牌之后,xAI紧锣密鼓地发上重磅新品了——首个Coding Agent,Grok Build。直接在终端运行、专为专业软件工程和复杂编程任务设计……对标的是谁,属于是摆在明面上的。

来自主题: AI资讯
9454 点击    2026-05-15 13:35
TACO: 让 CLI Agent 在自主迭代中学会丢掉无用上下文

TACO: 让 CLI Agent 在自主迭代中学会丢掉无用上下文

TACO: 让 CLI Agent 在自主迭代中学会丢掉无用上下文

随着代码智能从 code foundation models 走向 autonomous coding agents,CLI/terminal 正在成为智能体进入真实软件工程工作流的重要入口。

来自主题: AI技术研报
5314 点击    2026-05-07 15:03
“DeepSeek版Claude Code”,Github 2.3k星

“DeepSeek版Claude Code”,Github 2.3k星

“DeepSeek版Claude Code”,Github 2.3k星

DeepSeek也有自己专属的Coding Agent了。名字简单粗暴,就叫DeepSeek-TUI,作者自称是一名“鲸鱼兄弟”的DeepSeek爱好者。刚刚,这个项目的星标数突然开始骤增,来到了2.3k,还登上了GitHub热榜。

来自主题: AI资讯
8562 点击    2026-05-04 13:23
大模型“降智”真相,找到了

大模型“降智”真相,找到了

大模型“降智”真相,找到了

今天,智谱发布了一篇名为《Scaling Pain:超大规模Coding Agent推理实践》的技术报告,披露了GLM-5系列模型在Coding Agent场景下遇到的推理基础设施挑战与对应解法。

来自主题: AI技术研报
9477 点击    2026-04-30 13:52
OpenAI工程师把话挑明了:一个人盯3到5个Coding Agent,基本就到顶了!反手开源 Symphony ——一套「少盯人、多验收」的新系统

OpenAI工程师把话挑明了:一个人盯3到5个Coding Agent,基本就到顶了!反手开源 Symphony ——一套「少盯人、多验收」的新系统

OpenAI工程师把话挑明了:一个人盯3到5个Coding Agent,基本就到顶了!反手开源 Symphony ——一套「少盯人、多验收」的新系统

OpenAI工程师公开发帖承认:哪怕用的是Codex,一个人能有效监督的coding agent也就3到5个,再多生产率直接往下掉。更劲爆的是,OpenAI没有选择"让人盯更多屏幕",而是直接开源了Symphony——一套把人类从"实时盯盘"解放成"异步验收"的全新工作流系统。近40万人围观,近3000人收藏。

来自主题: AI资讯
9004 点击    2026-04-29 22:11
Claude Code新功能Auto Mode能否替代人工审核?首个压力测试来了

Claude Code新功能Auto Mode能否替代人工审核?首个压力测试来了

Claude Code新功能Auto Mode能否替代人工审核?首个压力测试来了

随着 AI coding agent 从 “辅助写代码” 走向 “直接执行开发操作”,模型开始被赋予修改代码、部署服务等真实运维权限。为减少频繁人工确认带来的打断,Anthropic 近期为 Claude Code 推出 Auto Mode,希望通过自动分类代替用户审核操作。

来自主题: AI资讯
7418 点击    2026-04-19 13:28
大佬深度解析:Coding Agent的底层运行逻辑是什么?

大佬深度解析:Coding Agent的底层运行逻辑是什么?

大佬深度解析:Coding Agent的底层运行逻辑是什么?

在本文中,我将探讨编码智能体(coding agents)及其智能体编排(agent harnesses)的整体设计:它们究竟是什么、工作原理如何,以及在实际应用中各组件是如何协同运作的。

来自主题: AI技术研报
7673 点击    2026-04-13 13:50